ter Meer, Steinmeister & Partner GbR Beschwerdeaktenzeichen: T0265/05-351 Einspruch gegen EP 1 004 956 Hynix Semiconductor ./. Rambus Inc. Anlage UB4

\_ 日本国特許庁(JP)

⑩ 特許出 頤 公開

#### 平1-124193 ⑩公開特許公報(A)

Mint Cl.4

識別記号

庁内整理番号

母公開 平成1年(1989)5月17日

G 11 C 11/34

362

C-8522-5B

審査請求 未請求 発明の数 1 (全14頁)

半導体記憶装置 ❷発明の名称

> ②特 飁 昭62-281619

昭62(1987)11月6日 田野 阻

島

兵庫県伊丹市瑞原4丁目1番地 三菱電機株式会社エル・ 明 者 蒑 伊発 エス・アイ研究所内

兵庫県伊丹市瑞原 4 丁目 1 番地 三菱電機株式会社エル・ 雄 **₽** 松  $\blacksquare$ 吉

エス・アイ研究所内

兵庫県伊丹市瑞原 4 丁目 1 番地 三菱電機株式会社エル・ 個発 明

エス・アイ研究所内

東京都千代田区丸の内2丁目2番3号 三菱電機株式会社 ⑪出 顋 人

弁理士 大岩 増雄 外2名 四代 理 人

1. 発明の名称

半導体記憶装置

- 2. 特許胡求の範囲
- (1) 複数行および複数列に配列された複数 のメモリセルからなりかつ複数列単位の複数のブ ロックに分割された第1のメモリセルアレイ、

前記複数のメモリセルの各行を選択するための 行選択手段、

前記複数のメモリセルの各列を選択するための 列避択手段、

プロック選択信号を入力するプロック選択信号 入力手段、

前記プロック選択信号に応答して前記第1のメ モリセルアレイの前記複数のブロックのいずれか を選択するためのプロック選択手段、

仮数行および仮数列に配列された複数のスタテ ィック形メモリセルからなりかつ複数列単位の複 数の前域に分割された第2のメモリセルアレイ、 領域選択信号を人力する領域選択信号入力手段、

前紀節域選択似分に応答して前紀第2のメモリ セルアレイの前記複数の紙域のいずれかを選択す るための領域選択手段、

前記プロック選択手段により選択された前記部 1のメモリセルアレイにおけるプロックと同紀領 **延選択手段により選択された前記第2のメモリセ** ルアレイにおける領域との関でデータの転送を行 なうデータ転送手段、

前記第2のメモリセルアレイの前記各領域内に おいて、複数の同記スタティック形メモリセルに 対応する情報のうちのいずれかを選択する第1の 選択手段、および

前紀第1の選択手段により前記各領域ごとに選 択された複数の前記情報のいずれかを前記領域進 択信号に応答して選択する第2の選択手段を何え た半導体記憶装置。

(2) 前紀行選択手段は行アドレス信号に応 答して前記箔1のメモリセルアレイの行を選択し、 前記列選択手段は列アドレス倡号に応答して前記 節1のメモリセルアレイの列を選択し、

前記第1の選択手段は前記列アドレス信号に応じて前記第2のメモリセルアレイの行および列を選択し、前記第2のメモリセルアレイの各行と前記第1のメモリセルアレイの同一のブロックにおける複数行との間でデータの転送が行なわれる侍許請求の範囲第1項記載の半導体記憶装置。

(3) 前記第1のメモリセルアレイは、ダイナミック形メモリセルにより構成され、前記第1のメモリセルアレイからのデータを出力する出力 端子と前記第2のメモリセルアレイからのデータ を出力する出力端子とを得えた特許結束の範囲第 1項または第2項記載の半導体記憶装置。

#### 3. 免明の詳細な説明

#### [庶森上の利用分野]

、この免明は、節あキャッシュシステム用半導体 記憶装置に関し、特にキャッシュメモリを開一チ ップ上に乗復化した半導体記憶装置に関するもの である。

#### [従来の技術]

従来より、コンピュータシステムのコストパー

とができなかった。そこで従来は、汎用のDRAMが有しているページモードまたはスタティックコラムモードを利用して節島キャッシュシステムを構成していた。

第5図はページモードまたはスタティックコラムモードが可能な従来のDRAM業子の基本構成を示すブロック図である。

図において、メモリセルアレイ1には、複数のワード報封よび複数のピット線対が互いに交差するように配置されており、それらの各交点にメモリセルが設けられている。メモリセルアレイ1のワード線はワードドライバ2を介して行デコーダ部3に接続されている。またメモリセルアレイ1ののピット線対はセンスアンブ部4および1/クスイッチ部5を介して列デコーダ部6には列アドレスパッファインは続きれて、列デコーダ部6には列アドレスパッファファクおよび列アドレスパッファ8には、行アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAおよび列アドレス信号RAをする

フォーマンスを向上させるために、低速で大容量 したがって低コストのDRAMで構成したメイン メモリと中央旅算処理袋置(CPU)との関に、 高速のパッファとして小容量の高速メモリを設け ることがよく行なわれている。この高速のバッフ ァはキャッシュメモリと呼ばれ、CPUが必要と する可能性の高いデータのブロックが、メインメ モリからコピーされて紀位されている。CPUが アクセスしようとしたDRAMのアドレスに紀位 されているデータがキャッシュメモリに存在する ときにはヒットと呼ばれ、CPUは高速のキャッ シュメモリに対してアクセスする。一方、CPU かアクセスしようとしたアドレスに記憶されてい るデータがキャッシュメモリに存在しないときに はキャッシュミスと呼ばれ、CPUは低速のメイ ンメモリにアクセスすると同時に、そのデータの 因するプロックをキャッシュメモリに転送する。

しかしながら、このようなキャッシュメモリシステムは、高価な高速メモリを必要とするので、 コストを重視する小型のシステムでは使用するこ

チプレクスしたマルチプレクスアドレス信号MP XAが与えられる。さらに I / Oスイッチ部5に は出力バッファ 9 および入力パッファ 1 Oが接続 されている。

第6A図、第6B図、および第6C図にそれぞれDRAMの通常の読出サイクル、ページモードサイクルおよびスタティックコラムモードサイクルの動作波形図を示す。

第6 A 図に示す通常の統出サイクルにおいては、まず、行アドレスパッファ 7 が、行アドレスストロープ信号RASの降下エッジでマルチプレクスアドレス信号MPXAを取込んで行アドレス信号RAとして行デコーダ部3に与える。行デコーダ部3はその行アドレス信号RAに応じて、複数のワード線のうち1本を選択する。これにより、この選択されたワード線に接続された複数のメモリセル内の情報が各ピット線に提出され、その情報がセンスアンプ部4により換知、増福される。この時点で、1行分のメモリセルの情報がセンスアンプ部4にラッチされている。次に、列アドレス

パッファ8が、コラムアドレスストローブ信号で ASの降下エッジでマルチプレクスアドレス信号 MPXAを取込んで列アドレスは号CAとして列 デコーダ郎6に与える。列デコーダ邸6は、その 列アドレス信号CAに応じて、センスアンプ邸4 にラッチされている1行分の情報のうち1つを選 択する。この選択された情報は1/ロスイッチ部 5 および出力パッファ9を介して出力データD。 ит として外郎に取出される。この場合のアクセ スタイム (RASアクセスタイム) しょぁc は、 ロウアドレスストローブ信号RASの降下エッジ から出力データDour が有効となるまでの時間 である。また、この場合のサイクルタイムしょは、 業子がアクティブ状態となっている時間とRAS プリチャージ時間 t m r との和となり、様準的な 値としては、talc = 100nsの場合でte - 200n s 役皮となっている。

第6 B 図および第6 C 図に示すページモードお よびスタティックコラムモードは、同一行上のメ モリセルを列アドレス信号 C A を変化させてアク セスするものである。ページモードにおいては、コラムアドレスストローブ借号 CAS の降下エッジで列アドレスほ号 CAをラッチし、スタティックコラムモードにおいては、スタティックRAM (SRAM) のように列アドレスほ号 CAの変化のみでアクセスする。ページモードおよびスタティックコラムモードの CAS アクセスタイムしょ。はRASアクセスタイムしょ。はRASアクセスタイムしょ。はRASアクセスタイムしょ。はCASアクセスタイムしょ。はCASアクセスタイムしょ。に対して50ns 程度となる。この場合、サイクルタイムも高速になり、ページモードの場合は CAS ブリチャージ時間 tc,の値によるが、スタティックコラムモードと間機の50ns 程度の値が得られている。

第7図は、第5図のDRAM米子のページモードあるいはスタティックコラムモードを利用した 簡品キャッシュンステムの構成を示すプロック図 である。また第8図は第7図の館品キャッシュシ ステムの動作波形図である。

坊7凶において、メインメモリ.20は1M×1

**楫成の8翅のDRAM希子21により1Mパイト** に構成されている。この場合、行アドレス信号R Aと列アドレス信号CAとは合計20ピット(2 ₹ ° -1048576-1M) 必要となる。アド レスマルチプレクサ22は、10ピットの行アド レス信号RAと10ピットの列アドレス信号CA とを2回に分けてメインメモリ20に与えるもの であり、20ピットのアドレスは号を受ける20 本のアドレス線A。~Aig とマルチプレクスさ れた10ピットのアドレス信号(マルチプレクス アドレス信号MPXA)をDRAM衆子21に与 える10本のアドレス様A。~A。を有している。 アドレスジェネレータ23は、CPU24が必 翌とするデータに対応するアドレス信号を発生す る。ラッチ(TAG)25は、前のサイクルで進 択されたデータに対応する行アドレス信号RAを 保持しており、コンパレータ26は、20ピット のアドレス信号のうち10ピットの行アドレス信 号RAと、TAG25に保持されている行アドレ スは考RALとを比較する。両者が一致すれば、

前のサイクルと同じ行がアクセスされた(ヒットした)ことになり、コンパレータ26は高レベルのキャッシュヒット(Cache Hit)信号CHを発生する。ステートマシン27は、キャッシュヒット信号CHに応答して、ロウアドレスストローブ信号RASを低レベルに保ったままコラムアドレスストローブ信号CASをトグルするページモード制御を行ない、それに応答してアドレスマルチブレクサ22はDRAM業子21に列アドレス信号CAを与える(第8回参照)。このようにヒットした場合には、DRAM業子21からアクセスタイムして、Acで高速に出力データが得られることになる。

一方、アドレスジェキレータ23から発生された行アドレス信号RAとTAG25が保持していた行アドレス信号RALとが不一致のとき、頃のサイクルと現なる行がアクセスされた(キャッシュミスした)ことになり、コンパレータ26は高レベルのキャッシュヒット信号CHを発生しない。この場合、ステートマシン27は過奮の統出サイ

クルのRAS およびCAS 納爾を行ない、アドレスマルチプレクサ22は行アドレス信号RA および列アドレス信号CAを順にDRA M業子21に与える(第8図参照)。このようにキャッシュミスした場合には、RASのプリチャージから始まる通常の説出サイクルを行ない、低速のアクセスタイム takc で出力データが得られることになるので、ステートマシン27はウエイト信号 Waltを発生し、CPU24に冷機をかける。キャッシュミスの場合は、TAG25に新しい行アドレス信号RAが保持される。

このように、第7図の簡易キャッシュシステムにおいては、DRAM素子のメモリセルアレイの1行分(1Mピット案子の場合は1024ピット)のデータが1プロックとなるので、プロックサイズが不必要に大きく、TAG25に保持されるプロック数(エントリ数)が不足する(第7図のシステムでは1エントリ)ことになり、キャッシュのヒット串が低いという問題点があった。

なお、その他の従来例として、米国特許第4.

部4と1/0スイッチ部5との間にトランスファゲート部115よびSRAMメモリセルアレイ12が設けられ、さらにプロックデコーダ13おロックデコーダ13には、プロック数に応じて列アドレスバッファ8から列アドレス信号CAの一部が供給されるが、その活性化はキャッシュヒット信号CHにより刻される。また、ウエイデコーレスに号WAが与えられる。ウエイデコーレスに号WAが与えられる。ウエイアドレス信号WAに応じてSRAMメモリセルアレイ12のワード锿を選択駆動する。

第10図は第9図のDRAM素子の一部分の協 成を詳細に示した図である。

第10図において、センスアンブ部4、トランスファゲート部11、SRAMメモリセルアレイ 12、1/0スイッチ部および列デコーダ部6は、 DRAMメモリセルアレイ1の複数のピット線対 BL、BTに対応して、それぞれ複数のセンスア 577、293号に関示されたような簡易キャッシュシステムもあるが、この簡易キャッシュシステムもあるが、この簡易キャッシュンストをよせリセルアレイ外に設け、ヒットした場合は値接このレジスタからデータを取出すことによりアクセスの高速化を図ったものである。しかしながら、この特許公報に関示された簡易キャッシュシステムも、外部レジスタはメモリセルアレイの1行分のデータを保持するものであり、プロックサイズが不必要に大きく、第5図および第7図に示す従来例と同様に、キャッシュのヒット率が低いという間節を生ずる。

そこで提案されたのが第9図に示すキャッシュ メモリ内蔵DRAM楽子である。

このDRAM素子が第5図のDRAM素子と異なるのは以下の点にある。すなわち、DRAMメモリセルアレイ1は、そのアドレス空間上で複数列のメモリセルからなる複数のブロックに分割されている。第9図においては4つのブロックB1~B4に分割されている。そして、センスアンブ

ンプ40、トランスファゲート110、SRAM メモリセル120、1/0スイッチ50および列 デコーダ60からなる。また、DRAMメモリセ ルアレイ1の各プロックに対応してプロックデコ ーダ13が配置されている。各センスアンプ40 は各ピット線対BL、BL間に接続されている。 そして各ピット線対BL、BLはNチャネルMO SFETQ1、Q2からなるトランスファゲート 110を介してSRAMメモリセルアレイ12の ピット線対SBL、SBLに接続されている。S RAMメモリセルアレイ12のピット線対SBL。 SBCはNチャネルMOSFETQ3. Q4を介 してそれぞれ1/0パス1/0, 丁/0に技袋さ れている。トランスファゲート110のMOSF ETQ1、Q2のゲートには、プロックデコーダ 13により各プロックごとに共通の転送信号が与 えられる。また、各1/0スイッチ50のMOS PETQ3、Q4のゲートには、対応する列デコ ーダ60によりコラム選択信号が与えられる。

このDRAM弟子においては、ブロックデコー

ダ13が各プロックに対応するトランスファゲート 110に転送信号を与えることにより、DRA Mメモリセルアレイ1からプロック PP 位で同一行上のデータがSRA Mメモリセルアレイ12に転送される。ウエイデコーダ14によりSRA Mメモリセルアレイ12のワード線W、~W。のいずれかが選択されると、そのワード線に連続されたSRA Mメモリセル120に記憶されたデータが各ピット線対SBL、SBL上に統出されたデータが会ピット線対SBL、SBL上に統出されたデータは、列デコーダ60から1/0スイッチ50にコラム選択信号が与えられることによって、1/0パス1/0、1/0に統出される。

このDRAM業子によると、複数列の1行のデータを1つのデータブロックとして、異なる行上の複数のデータブロックが複数のSRAMメモリセル120に保持される上に、岡一列の異なる行上のデータブロックが岡時にSRAMメモリセルアレイ12上に保持される(アソシアティピティ)。したがって、このSRAMメモリセルアレイを

キャッシュメモリとして利用すれば、データのエントリ数を増すことができ、その結果、キャッシュのヒット事を向上することができる。

さらに、SRAMメモリセルアレイ12のワードはW、~W。を非派性状態に保っておけば、DRAMメモリセルアレイ1への容込動作時やDRAMメモリセルアレイ1からの統出動作時にも、キャッシュメモリへの転送を行なわない構成が可能となり、キャッシュメモリンステムへの応用に自由皮が増すという利点が生じる。

第11図は第9図のDRAM素子を利用した数 易キャッシュシステムの構成を示すプロック図で ある。

第11図において、メインメモリ30は1M× 1構成の8個のDRAM業子31により1Mパイトに構成されている。第11図のメモリシステム が第7図のメモリシステムと相違するのは、DR AM業子31のブロック分けの致および5RAM メモリセルアレイ12のワード線の本数(セット 数)に対応してTAG25およびコンパレータ2

6の数が増加している点、および、コンパレータ 26からの出力であるキャッシュヒット信号 C B およびウエイアドレス信号 W A が D R A M 索子3 1に入力されている点である。ここでは、ウエイ アドレス信号は 2 ピットである。

第11図の前島キャッシュシステムの動作を従来の額島キャッシュシステムの説明で用いた第6 A図~第6C図および第12図の動作被形図を参照しながら説明する。

TAG25には、各プロック別に最も新しいサイクルで選択された行に対応する行アドレスが複数組キャッシュ別アドレスセットとして保持されている。ここでは、ウエイアドレス信号として2ピットを考えているので、4組の行アドレスが保持されている。したがって、プロック数を4とすると16組のアドレスセットがTAG25に記憶されていることになる。また、よく使用されるアドレスの組を固定的にTAG25に保持させておいてもよい。

まず、CPU24が必要とするデータに対応す

るアドレス信号をアドレスジェネレータ23が発 生する。コンパレータ26は、20ピットのアド レス信号のうち10ピットの行アドレス信号RA および列アドレス信号CAのうちブロック分けに **相当する複数ピット(第9図に示す例では2ピッ** ト) と、TAG25に保持されたアドレスセット とを比較する。そして両者が一致すればキャッシ ュにヒットしたことになり、コンパレータ26は 高レベルのキャッシュヒット信号CHおよびヒッ トしたプロックのウエイアドレス信号WAを発生 する。ステートマシン27は、このキャッシュヒ ット信号CHに広答しで、ロウアドレスストロー プ信号RASを低レベルに保ったままコラムアド レスストロープ留号CASをトグルし、これに応 答してアドレスマルチプレクサ22はDRAM奈 子31に10ピットの列アドレス倡号CAを与え、 る (第12図参照)。 このとき、DRAM条子3 1においては、第9図に示したようにキャッシュ ヒットは号CHによる制御により、列アドレス信 号CAはブロックデコーダ13には供給されない。 したがって、DRAMメモリセルアレイ1とSRAMメモリセルアレイ12とは分離された状態を降つ。そして、ウエイアドレス信号WAに対応した1行分のSRAMメモリセル120から各ピット線対SBL、SBL上にデータが終出される。また、列アドレス信号CAに応じた1/0スイッチ50が、列デコーダ60によって母近大はでウェイにより、列アドレス信号WAに応じた日本はなら、これにより、列アドレス信号WAによって母母CAおよモリセル120内のデータが1/0パス1/0. 「つおよび出力パッファ9を介して出力される。このようにヒットした場合には、SRAMメモリセル120からページモードのようにアクセスタイムにcacで高速に出力データが得られることになる。

一方、アドレスジェネレータ23から発生されたアドレス信号とTAG25に保持されたキャッシュ用アドレスセットとが不一致のときは、キャッシュミスしたことになり、コンパレータ26は 高レベルのキャッシュヒット信号CHを発生しな

このように、 第9 図の D R A M 素子を用いた簡 品キャッシュシステムにおいては、 キャッシュメ モリとしての S R A M メモリセルアレイ 1 2 に扱 数のプロックのデータが保持されるので、 T A G 25へのデータのエントリ数を増加することが可 能となり、キャッシュのヒット事が高くなる。

また、ここでは、キャッシュミスした場合に、DRAMメモリセルアレイにアクセスすると同時に、SRAMメモリセルアレイからなるキャッシュメモリにデータを転送する例を示したが、SRAMメモリセルアレイのすべてのワード線を非選択状態にすることでこの転送を禁止することもできる。同様に、DRAMメモリセルアレイへの容込動作の場合も、SRAMメモリセルアレイへへ転送するか否かを選択することも可能である。なお、第11図に示した例は、4ウエイセットアソシアティブキャッシュシステムに相当する。

#### [免明が解決しようとする問題点]

しかし、上記の簡易キャッシュシステムにおい ては、キャッシュヒットした場合、キャッシュメ い。この場合、ステートマシン27は過常の袋出 サイクルのRAS および CAS 制御を行ない、ア ドレスマルチプレクサ22は行アドレス信号RA および列アドレス信号CAを順にDRAM素子3 1に供給する(第12図参照)。このようにキャ ッシュミスした場合には、低速のアクセスタイム t。Acで出力データが得られることになるので、 ステートマシン27はウエイトは号W a i tを免 生し、CPU24に存機をかける。キャッシュミ スの場合は、そのときにアクセスされたメモリセ ルを含むブロックのデータが、ブロックデコーダ 13により尊重状態とされるトランスファゲート 110を介して、DRAMメモリセルアレイ1の ピット線BL、BLから、ウエイアドレス信号W Aにより選択されたSRAMメモリセル120の プロックに一括転送される。これにより、このブ ロックのSRAMメモリセル120の記憶内容が **卋換えられる。また、そのブロックの対応するウ** エイアドレス信号WAに関するTAG25には新 しいアドレスセットが保持される。

モリとしてのSRAMメモリセルアレイ12をアクセスするためのアドレス信号のうちウエイアドレス信号WAは、コンパレータ26での比較後に出力される。したがって、ウエイアドレス信号WAのDRAM架子31への供給が遅れるため、SRAMメモリセルアレイ12のワード線の駆動が遅れ、高速のSRAMメモリセルアレイ12をキャッシュメモリとして使用できる装置でありながら、ヒット時のアクセスタイムを高速にできないという欠点があった。

この発明は上記のような関節点を解析するためになされたもので、ヒット時のアクセスタイムを 高速にできるキャッシュシステムを構成すること が可能なキャッシュメモリ内蔵半導体記憶袋置を 提供することを目的としている。

#### [問題点を解決するための手段]

この発明に係る半身体配位袋型は、第1のメモリセルアレイ、行選択手段、列選択手段、ブロック選択信号入力手段、ブロック選択手段、第2のメモリセルアレイ、領域選択信号入力手段、領域

選択手段、データ転送手段、第1の選択手段、お よび第2の選択手段を備えたものである。

第1のメモリセルアレイは、複数行および収数列に配列された複数のメモリセルからなり、かつ 複数列単位の複数のプロックに分割されている。 行選択手段は、複数のメモリセルの各行を選択するためのものである。列選択平段は、複数のメモリセルの各列を選択するためのものである。プロック選択信号入力平段は、プロック選択信号を入力するためのものである。プロック選択手段は、プロック選択信号に応答して、第1のメモリセルアレイの複数のプロックのいずれかを選択するものである。

また、第2のメモリセルアレイは、複数行および複数列に配列された複数のスタティック形メモリセルからなり、かつ複数列単位の複数の領域に分割されている。領域選択信号入力手段は、領域選択信号を入力するためのものである。領域選択手段は、領域選択信号に応答して、第2のメモリセルアレイの複数の領域のいずれかを選択するも

のである。データ伝送手段は、プロック選択手段により選択された第1のメモリセルアレイにおけるプロックと領域選択手段により選択された第2のメモリセルアレイにおける領域との間でデータの転送を行なうものである。

さらに、第1の選択手段は、第2のメモリセルアレイの名領域内において複数のスタティック形メモリセルに対応する情報のうちのいずれかを選択するものである。第2の選択手段は、第1の選択手段により各領域ごとに選択された複数の情報のいずれかを領域選択信号に応答して選択するものである。

#### [作用]

この免別に係るキャッシュメモリ内蔵半専体記 は交替においては、第1のメモリセルの複数行上 の複数列単位のデータブロックを第2のメモリセ ルアレイ上に保付することができる上に、第1の メモリセルアレイの同一列における異なる行のデ ータブロックを複数傾同時に第2のメモリセルア レイの異なる領域に保持することができる。また、

第1のメモリセルアレイの同一列にかかる異なる 行のデータブロックを第2のメモリセルアレイの 同一行に配置することもできる。したがって、こ の第2のメモリセルアレイをキャッシュメモリと して利用すれば、データのエントリ数を効率的に 増すことができるばかりでなく、キャッシュメモ リのアクセスタイムを高速にすることができる。 【変趣例】

以下、この宛明の一実施例を図面を用いて袋明 する。

第1回はこの宛明の一実施例によるDRAM素子の構成を示すプロック図である。

この実施例は以下の点を除いて第9図に示すD RAM索子と同様であり、相当部分には同一の多 風番号を付し、適宜その説明を省略する。

図において、DRAMメモリセルアレイ1は、 そのアドレス空間上で複数のブロックに分割され ている。この実施例では4つのブロックBK1~ BK4に分割されている。一方、SRAMメモリ セルアレイ12は故紋列単位の故数のウエイに分割されている。この実施例では4つのウエイA~ Dに分割されている。但し、DRAMメモリセル アレイ1のブロック数とSRAMメモリセルアレ イ12のウエイ数は異なっていてもよい。

DRAMメモリセルアレイ1とSRAMメモリセルアレイ12との間には、センスアンプ部4、プロックトランスファゲート部11、内部1/0 帯41、およびウエイトランスファゲート部42 が配置されている。プロックトランスファゲート部11は、DRAMメモリセルアレイ1のいずれかのブロックの1行のデータを内部1/0符41に転送するものである。プロックデコーダ13は、列アドレス信号CAのうちの一部(この実施例の場合2ピット)に応答して、DRAMメモリセルアレイ1のどのプロックのデータを転送するものである。ウエイトランスアゲート部42は、内部1/0份41に転送されたデークを、SRAMメモリセルアレイ12のいずれかのウエイに転

送するものである。ウエイデコーダ14は、ウエイアドレスパッファ15を介して与えられるウエイアドレス信号WAに応答して、内部!/0部41のデータをSRAMメモリセルアレイ12のどのウエイに転送するかをウエイトランスファゲート部42に指令するものである。

SRAMメモリセルアレイ12には、キャッシュ行デコーダ43、キャッシュ1/0スイッチ部44およびキャッシュ列デコーダ43は、キャッシュ行デコーダ43は、キャッシュ行アコーダ43は、キャッシュ行アレスに号に応答して、SRAMメモリセルアレイ12の1行を選択するものである。キャッシュ列デコーダ節45は、キャッシュ列デコーダの方式られるキャッシュ列デコーダのである。キャッシュアドレスに号に応答して、各ウエイ内の1列を選択するものである。キャッシュアドレスに号に応答して、各ウエイ内の1列を選択するものである。キャッシュアドレスに号に応答して、とウェアドレスに号に応答して、とウェアドレスに号に応答して、とウェアドレスに号に応答して、とファンコアドレスに号に入力し、その一部をキャッシュ行デコー

ダ43にキャッシュ行アドレス信号として与え、他をキャッシュ列デコーダ43にキャッシュ列デコーダ43にキャッシュ列アドレス信号として与えるものである。キャッシュ 1/0スイッチ部44には、SRAMメモリセルアレイ12の各ウエイに対応する複数のSRAM ルセンスアンブ47がそれぞれ 1/0線対1/0 ペー1/0。を介して複数されている。

キャッシュ行デコーダ43およびキャッシュ列 デコーダ部45により各ウエイごとに選択された SRAMメモリセルアレイ12内のデータがモれ ぞれ対応するSRAM用センスアンブ47により 検知、増幅される。ウエイセレクタ48は、ウエ イアドレスパッファ15から与えられるウエイア ドレス信号WAに応答して、扱数のSRAM用セ ンスアンブ47により与えられたデータのうちの 1つを選択して、出力バッファ9bを介してキャ ッシュ出力データDourとして外部に出力できる ものである。キャッシュ入力データDINとして 人力バッファ10bに与えられたデータをSRA Mメモリセルアレイ12の1つのメモリセルに告

込む場合は、上記と逆の経路で行なわれる。

第1回においては、DRAMメモリセルアレイ 1のプロックBK1の各行のデータA, . B, . C, およびD, がSRAMメモリセルアレイ12 の各ウエイA. B. CおよびDの同一行にそれぞれ転送された状態が示されている。

第2回は、第1回の一部分の構成を詳細に示す 図である。

DRAMメモリセルアレイ1の各プロックBK 1~BK4において、センスアンプ部4およびプロックトランスファゲート部11は、n 紅のピット線対BL,~BL。に対応してそれぞれの個のセンスアンプ部40およびの個のプロックトランスファゲート110からなる。また、内部 I / O。からなる。各プロックのピット線対BL,~BL。はセンスアンプ40およびプロックトランスファゲート110を介して対応するI / O 線対 I / O,~I/O。にそれぞれ後続きれている。

一方、SRAMメモリセルアレイ12は4つの

ウエイに分割され、各ウエイはn列のSRAMメ モリセル120、すなわちn組のピット線対SB L,~SBL。からなる。各ウエイにおいて、ウ エイトランスファゲート部42は、n組のピット 線対SBL,~SBL。に対応してそれぞれn倒 のウエイトランスファゲート420からなる。 各 ウエイにおけるn組のピット線対SBLi~SB し。は、それぞれウエイトランスファゲート42 0を介して内部1/0帯41の対応する1/0線 対1/0,~1/0。にそれぞれ抜続されている。 キャッシュ1/0スイッチ邸44は、S.RAMメ モリセルアレイ12の各ピット線対SBL, ~ S. BL。に対応する複数のキャッシュ【/Oスイッ チ440および各ウエイに対応する4組の1/0 は1/0~1/0。からなる。各ウエイに属す るn机のピット線対SBL。~SBL。は、それ ぞれキャッシュ1/0スイッチ440を介して、 そのウエイに対応する1/0様に技続されている。 たとえば、ウエイCに属するピット線対SBL; ~SBL。はすべて1/0段対1/0cに依続さ

れている。また、各ウエイごとにキャッシュ列デコーダ部45が設けられている。各ウエイのキャッシュ列デコーダ部45は、各列に対応するn個のキャッシュ列デコーダ450からなる。各キャッシュ列デコーダ450は、対応するキャッシュ I/Oスイッチ440のMOSトランジスタのゲートに依頼されている。

郊3図は、郊1図のDRAM素子を利用した朗 岛キャッシュシステムの構成を示すプロック図で ある。

第3図において、メインメモリ30は1M×1 構成の8例のDRAM素子31により1Mバイト に構成されている。第3図のメモリシステムが第 11図のメモリシステムと相違するのは、コンパ レータ26からの出力であるキャッシュヒット信 号CHの代わりに、マルチプレクサ22によりマ ルチプレクスされる前の列アドレス信号に相当す る10ビットのアドレス信号がキャッシュアドレ ス信号CCAとしてDRAM業子31に入力され ている点、および、キャッシュヒット信号CHに 応答してステートマシン27が免生するデータセレクト信号DSがデータセレクタ51に人力されている点である。データセレクタ51は、データセレクト信号DSに応答して、DRAM素子31から与えられるDRAMデータDDまたはキャッシュデータCDを選択して出力するものである。 第3図の問題キャッシュンステムの動作を第4

TAG25には、各プロック別に最も新しいサイクルで選択された行に対応する行アドレスが複数組キャッシュ用アドレスセットして保持されている。ここでは、ウエイアドレス信号WAとして2ピットを考えているので、4組の行アドレスが保持されている。したがって、プロックを4とすると16組のアドレスセットがTAG25に記憶されていることになる。また、よく使用されるアドレスを固定的にTAG25に保持させておいてもよい。

まず、CPU24が必要とするデータに対応するアドレスはサをアドレスジュネレータ23が発

生する。コンパレータ26は、20ビットのアドレス信号のうち10ビットの行アドレス信号RAおよび列アドレス信号CAのうちブロック分けに相当する複数ビット(第3図に示す例では2ビット)とTAG25に解けされたアドレスセットとを比較する。そして両者が一致すればキャッシュがヒットしたことになり、コンパレータ26は高レベルのキャッシュヒット信号CHおよびヒットしたブロックのウエイアドレス信号WAを発生する。

このコンパレータ26によるアドレス信号の比較に完立って、キャッシュヒットすることを前提に、DRAM素子31へは10ピットのキャッシュアドレス信号CCAが入力され、SRAMメモリセルの続出動作が逃行している。ここでは4ウエイを考えているので4ピットの続出動作が逃行している。したがって、キャッシュにヒットしたときは、ウエイアドレス信号WAが入力されると、 ではに所望のデータがキャッシュデータCDとしてキャッシュ出力パッファ9bを介して出力され、 キャッシュヒット信号CHに応答して発生される データセレクト信号DSによって、データセレク タ51からキャッシュメモリのデータが得られる ことになる。

逆に、コンパレータ26に入力されたアドレス 信号がTAG25に保持されたアドレスセットと 不一致のときは、キャッシュミスしたことになり、 コンパレータ26はキャッシュヒット信号CHを 発生しない。これにより、SRAMメモリセルか ら出力されるキャッシュデータCDは無視される ことになる。この場合、ステートマシン27は趙 常の読出サイクルのRAS およびCAS製御を行 ない、アドレスマルチプレクサ22は行アドレス 信号RAおよび朔アドレス信号CAを順にDRA-M業子31に供給する(第4回参照)。このよう にキャッシュミスした場合には、低速のアクセス タイムtaac で出力データが得られることにな るので、ステートマシン27はウエイトは号Wa i tを発生し、CPU24に符牒をかける。キャ ッシュミスの場合は、そのときにアクセスされた

メモリセルを含むプロックのデータが、プロック デコーダ13により導通状態とされるプロックト ランスファゲート110を介して、内部!/O帯 41の!/O線対!/O,~!/O。に転送される。そして、それらのデータはウエイアドレス信 号WAにより選択されるウエイトランスファゲート420を介してSRAMメモリセルアレイ12 の適当なウエイに転送された行上のSRAMメモリセ ル120の記憶内容が普換えられる。また、その データのプロックの対応するウエイに関するTA G25には、今回アクセスされた新しいアドレス セットが保持される。

以上説明したように、上記実施例では、キャッシュメモリとしてのSRAMメモリセルアレイ120に複数プロック分のデータが保持されるので、TAG25へのデータのエントリ数を増すことができ、その結果ヒットの確率を向上せることができ、かつ、キャッシュメモリのアクセスタイムが高速になるという効果がある。

袋屋の構成を示すプロック図、第2図は第1図の 半導体記憶装置の一部分の構成を詳細に示すプロ ック図、第3図は第1図の半導体記憶装置を利用 した簡易セットアソシアティブキャッシュシステ ムの榾成を示すプロック図、第4図は第3図の簡 昌キャッシュシステムの動作波形図、第5図は従 来のDRAM素子の構成を示すプロック図、第6 A団は従来のDRAM素子の通常の統出サイクル の動作波形図、第6B図は従来のDRAM業子の ページモードサイクルの動作波形図、第6C図は 従来のDRAM幸子のスタティックコラムモード サイクルの動作波形図、第7図は第5図のDRA M柔子を利用した節島キャッシュシステムの構成 を示すプロック図、第8図は第7図の剪爲キャッ シュシステムの動作波形図、第9図はキャッシュ メモリ内蔵DRAM菜子の構成を示すプロック図、 第10図は第9図のDRAM素子の一部分の構成 を詳細に示すプロック図、第11回は第9図のD RAM★子を利用した勘島キャッシュシステムの 協成を示すプロック図、第12図は第11図の簡

#### [発明の効果]

以上のようにこの発明によれば、ブロックサイ ズを不必要に火きくすることなく、第1のメモリ セルアレイのデータプロックを第2のメモリセル アレイに多数保持することができるので、データ のエントリ数を効率的に増加することができる。 さらに、第1のメモリセルアレイの同一列に関す る異なる行のデータブロックを抑2のメモリセル アレイ上で同一行に存在するようにし、第2のメ モリセルアレイの各領域から情報を読出した後に 新城のいずれかを選択することができるので、第 2のメモリセルアレイをキャッシュメモリとして 用いると、キャッシュヒットした場合のアクセス タイムを飛躍的に高速化することが可能となる。 したがって、この発明の半導体記憶袋置を用いれ ばキャッシュのヒット中が高く高速な餌易セット アソシアティブキャッシュシステムを構成するこ とができる。

#### 4. 図面の簡単な説明

第1個はこの発明の一次施例による半導体記憶

**島キャッシュシステムの動作波形図である。** 

図において、1はDRAMメモリセルアレイ、 2はワードドライバ、3は行デコーダ部、4はセ ンスアンプ部、5は1/0スイッチ部、6は外デ コーダ郎、7は行アドレスパッファ、8は列アド レスパッファ、9m, 9bは出力パッファ、10 a.10bは人力パッファ、11はブロックトラ ンスファゲート邸、12は5RAMメモリセルア レイ、13はブロックデコーダ、14はウエイデ コーダ、15はウエイアドレスパッファ、41は 内部1/0份、42はウエイトランスファゲート 形、43はキャッシュ行デコーダ、44はキャッ シュー/0スイッチ部、45はキャッシュ列デコ ーダ部、46はキャッシュアドレスパッファ、4 7はSRAM用センスアンプ、48はウエイセレ クタ、BL、BLはDRAMメモリセルアレイの ピット線対、SBL、SBLはSRAMメモリセ ルアレイのピット放射である。

なお、図中、同一番号は同一または相当部分を示す。





特閒平1-124193 (12)









### 特間平1-124193 (13)









特閒平1-124193 (14)





第12図

ter Meer, Steinmeister & Partner GbR Beschwerdeaktenzeichen: T0265/05-351 Einspruch gegen EP 1 004 956 Hynix Semiconductor ./. Rambus Inc. Anlage UB5

### (19) JAPANESE PATENT OFFICE (JP)

# (12) PUBLICATION OF UNEXAMINED (KOKAI) PATENT APPLICATION (A)

(11) Kokai (Laid-Open) Patent Application Number 1-124193

(43) Date of Disclosure: May 17, 1989

(51) Int. Cl.<sup>4</sup>

Identification Symbol

Intra-Agency Number

G 11 C 11/34

362

C-8522-5B

Examination requested: not yet requested Number of inventions: 1 (total of 14 pages)

Title of the Invention: SEMICONDUCTOR MEMORY DEVICE (54)

Application Number: 62-281619 (21)Filing Date: November 6, 1987

- Inventor: Kazuyasu FUJISHIMA (72)c/o Mitsubishi Electric Corporation LSI Research Institute Hyogo-ken, Itami-shi, Mizuhara 4-chome, 1-banchi
- (72) Inventor: Yoshio MATSUDA c/o Mitsubishi Electric Corporation LSI Research Institute Hyogo-ken, Itami-shi, Mizuhara 4-chome, 1-banchi
- Inventor: Mikio ASAKURA (72)c/o Mitsubishi Electric Corporation LSI Research Institute Hyogo-ken, Itami-shi, Mizuhara 4-chome, 1-banchi
- Applicant: Mitsubishi Electric Corporation (71) Tokyo-to, Chiyoda-ku, Marunouchi 2-chome, 2-ban, 3-go
- Representative: Masuo OIWA, patent attorney, 2 others (74)

#### Specifications

- Title of the Invention: Semiconductor Memory Device 1.
- Scope of the Patent=s Claims 2.

- (1) A semiconductor manufacturing device, characterized by the fact that it is equipped with a plurality of memory cells arranged in a plurality of rows and a plurality of columns, having a first memory cell array, which is divided into a plurality of blocks comprising a plurality of column units;
- a row selection means, which is used to select respective rows of said plurality of memory cells;
- a column selection means, which is used to select respective columns of said plurality of memory cells;
  - a block selection means, which inputs a block selection signal;
- a block selection means, which is used to select any block from said plurality of blocks in said first memory cell array, in response to said block selection signal;
- a second memory cell array, comprising a plurality of static type memory cells, arranged in a plurality of rows and a plurality of columns and divided into a plurality of regions in a plurality of column units;
- a region selection means, which is used to select one out of said plurality of regions in said second memory cell array in response to said region selection signal;
- a data transmission means, transmitting data between the blocks in said first memory cell array, selected with said block selection means, and said second memory cell array, selected with said region selection means;
- a first selection means, which can select any information from the information items corresponding to a plurality of said static type memory cells, in each of said regions of said second memory cell array; and
- and a second selection means, which can select in response to said region selection sing any item among said plurality of information items selected per each of said regions by said first selection means.
- (2) The semiconductor manufacturing device of claim 1, wherein said row selection means selects a row in said first memory cell array in response to the row address signal;

said column selection means selects a column in response to the column address signal;

### [page 2]

and said first selection means selects said second memory cell array rows and columns in

response to said column address signal; so that data transmission operations are applied to a plurality of rows in the same block of said first memory cell array and each row of said second memory cell array.

(3) The manufacturing device of claim 1 or claim 2, wherein the construction of said first memory cell array comprises memory cells of the static type, equipped with output terminals providing output of data from said first memory cell array, and with output terminals providing output of data from said second memory cell array.

### 3. Detailed Explanation of the Invention

(Sphere of Industrial Use)

This invention relates to a semiconductor memory device for a simple cache system, in particular to a semiconductor memory device having a cache memory integrated on the same chip.

### (Prior Art Technology)

According to prior art, in order improve the cost performance of a computer system, a high speed memory having a low capacity was deployed as a high-speed buffer between the central processing unit (CPU) and the main memory construction designed with a DRAM construction for low speed and thus with at a low cost. This high-speed buffer is a so called cache memory in which a block of data, which is highly like to be required by the CPU, is copied from the main memory and stored. The state when data which stored in the DRAM address is present in the cache memory so that it could be accesses by the CPU is referred to as Ahit@, as the CPU can access the cache memory with a high speed. On the other hand, the state when the data stored in the address to be accessed by the CPU is not present in the cache memory is referred to as Acache miss@, wherein the CPU accesses the main memory with a low speed, while the CPU at the same time transfers to the cache memory the data block to which this data belongs.

However, because expensive high-speed memory is required for such a cache memory system, the system could not be used in a compact system in view of the cost. That is why conventionally, a general-purpose DRAM was configured as a page mode or static column mode configuration.

Figure 5 is a block diagram showing a basic construction of a conventional DRAM element which can be used with the page mode or with the static column mode.

In this figure, a memory cell array 1 is provided with a plurality of word lines and a plurality of bit lines arranged in a mutually intersecting arrangement, while memory cells are deployed in the intersection points. The word lines of the memory array 1 are connected through a word driver 2 to a row decoder part 3. In addition, the bit lines of the memory cell array 1 are connected through a sense amplifier part 4 and an I/O switch part 5 to a column decoder part 6.

A row address buffer 7 is connected to the row decoder part 3, and a column address buffer 8 is connected to the column decoder part 6. A multiple signal MPXA is applied multiplexed with the row address signal RA and the column address signal CA to the row address buffer 7 and the column address buffer 8. Furthermore, an output buffer 9 and an input buffer 10 are connected to the I/O switch part 5.

Figure 6A, Figure 6B and Figure 6C are waveform diagrams showing the operation of the cycle in an ordinary read cycle, page mode cycle and static column mode cycle of the DRAM, respectively.

In the ordinary read cycle shown in Figure 6A, the row address buffer 7 first acquires the multiplex address signal MPXA at the falling edge of the row address strobe signal <u>RAS</u> and applies it as row address signal RA to the row decoder part 3. The row decoder part 3 selects one word line from a plurality of word lines according to this row address signal RA. Because of that, information stored in a plurality of memory cells connected to this selected word line is read to each word line, and this information is detected and amplified by the sense amplifier part 4. At this point in time, information stored in the memory cell of 1 row segment is latched by the sense amplifier part 4.

### [page 3]

Next, the column address buffer 8 acquires the multiplex address signal MPXA at the falling edge of the column address strobe signal CAS and applies it as column address signal CA to the column decoder part 6. The column decoder part 6 then selects one of the information items in 1 line segment latched by the sense amplifier part 4 in response to this column address signal CA. This selected information is extracted to an external part as output data  $D_{OUT}$  through the I/O switch part 5 and the output buffer 9. The access time (RAS access time)  $t_{RAC}$  is in this case the time period valid from the falling edge of the row address strobe signal  $t_{RAC}$  until the output data  $t_{RAC}$  becomes valid. The cycle time  $t_{RAC}$  is in this case the sum of the time period created by the active state of the element and of the time period  $t_{RAC}$  of the  $t_{RAC}$  precharge. As a standard value,  $t_{C}$  is approximately 200 ns when  $t_{RAC} = 100$  ns.

In the page mode and static column mode shown in Figure 6B and Figure 6C, memory cells on the same row are accessed by changing the column address signal CA. In the page mode, the column address signal CA is latched at the falling edge of the column address row signal CAS. In the static column mode, access is achieved by simply changing the column address signal CA as in a static RAM (SRAM). The page mode and static column mode CAS, access time CAS and address access time  $T_{AA}$  therefore create about one 2 of the value of the RAS access time  $T_{RAC}$  for  $T_{RAC}$  = 100 ns., which is about 50 ns. A high speed of the of the cycle time is also created in this case, and in the case of the page mode, the value of about 50 ns is obtained in the same manner as in the static column mode with the CAS precharge time period value  $T_{CP}$ .

Figure 7 is a block diagram showing the construction of a simple cache system using the page mode or static column mode of the DRAM element shown in Figure 5. In addition, Figure 8 is a waveform diagram explaining the operation of the simple cache system shown in Figure 7.

As shown in Figure 7, the construction of the main memory 20 comprises 1 M byte comprising 8 DRAM elements 21. In this case, a total of 20 bits ( $2^{20} = 1048576 = 1$  M) is required by the row address signal RA and the column address signal CA. An address multiplexer 22, which applies 10-bit row address signal RA and 10-bit column address CA to the memory 20 twice, has 19 address lines  $A_0 \sim A_9$ , applying to the DRAM elements 21 10-bit address signal (multiplex address signal MPXA), which is received as 10-bit address signal and multiplexed by 20 address lines  $A_0 \sim A_{19}$ .

An address generator 23 generates address signal corresponding to the data requested by the CPU 24. A latch (TAG) 25 holds the row address signal RA corresponding to the data selected in the previous cycle. A comparator 26 compares row address signal RAL held in the TAG 25 to the 10-bit row address signal out of the 20-bit address signal. When both coincide, this means that the same row is accessed (hit) as in the previous cycle, the comparator 26 generates high-level cache hit (Cache Hit) signal CH. A state machine 27, responding to the cache hit signal CH, performs page mode control by toggling the address strobe signal CAS and maintaining a low level of the row address signal RAS. In response to that, the address multiplexer 22 applies the column address signal CA to the DRAM element 21 (see Figure 8). Therefore, in the case of such a Ahit@, output data will be obtained at a high speed from the DRAM element 21 with the access time t<sub>CAC</sub>.

On the other hand, when the address signal RA obtained from the address generator 23 does not match the row address signal RAL held by the TAG 25, a different row will be accessed than the row accessed in the previous cycle (cache miss), and the cache hit signal CH will not be generated at the high level by the comparator 26.

### [page 4]

In this case, the state machine 27 performs ordinary reading cycle <u>RAS</u> and <u>CAS</u> control and the address multiplexer 22 applies sequentially the row address signal RA and the column address signal CA to the DRAM element 21 (see Figure 8). In the case of such a cache miss, an ordinary read cycle starts from the <u>RAS</u> precharge, and because output data is obtained with low-speed access time t<sub>RAC</sub>, the state machine 27 generates the wait signal Wait and CPU 24 is brought into a wait state. In the case of a cache miss, a new row address signal RA is held in the TAG 25.

Therefore, because in the simple cache system shown in Figure 7, data corresponding to 1 row segment of the memory cell array of the DRAM element (1024 bits for a 1 M bit element) creates 1 block, the size of the block is unnecessarily large and because the number of blocks

(number of entries) held in TAG 25 is insufficient (1 entry in the system shown Figure 7), this created a problem known as a low cache hit rate.

Moreover, another conventional example of a simple cache system has been disclosed also in US Patent Number 4,577,293. This simple cache system has a register holding data in 1-row segments, which is created outside of the memory cell array, so that in the case of a hit, access is achieved with a high-speed design by reading data directly from this register. However, also according to this simple cache system disclosed in the US Patent Gazette, the block size is unnecessarily large and the problem is that that a low cache hit rate is created in the same manner as in the conventional examples shown in Figure 5 and Figure 7.

That is why a DRAM element provided with a built-in cache memory has been proposed as shown in Figure 9.

The differences between this DRAM element and the DRAM element shown in Figure 5 are as follows. Specifically, a DRAM memory array 1 is divided into a plurality of blocks comprising a plurality of memory cells in the address space of the memory array. In Figure 9, the array is divided into 4 blocks B1 ~ B4. Also, a transfer gate part 11 and a SRAM memory cell array 12 are deployed between a sense amplifier part 4 and an I/O switch part 5. Moreover, a block decoder 13 and a window decoder 14 are also used. While one part of the address signal CA is supplied from the column address buffer 8 according to the block number to the block decoder 13, the activation of the operation is controlled by the cache hit signal CH. Also, a way address signal WA is applied through a way buffer 15 to the way decoder 14. The way decoder 14 is operated to select a word line from the SRAM memory cell array 12 according to the way address signal WA.

Figure 10 is a diagram showing the detailed construction in one part of the DRAM element shown in Figure 9.

In Figure 10 is shown a sense amplifier part 4, a transfer gate part 11, a SRAM memory cell array 12, and an I/O switch part and column decoder part 6. The construction further comprises multiple bit line pairs BL, BL of the DRAM memory cell array 1, and the corresponding multiple sense amplifiers 40, transfer gates 110, SRAM memory cells 120, and I/O switches 50 and column decoders 60. In addition, block decoders 13 are arranged to correspond to each block of the DRAM memory cell array 1. Each sense amplifier 40 is connected to each bit line pair BL, BL. Also, each bit line part BL, BL is connected through a pair of bit lines SBL, SBL to the SRAM memory cell array 12 through the transfer gate 110 from the N-channel MOSFETs Q1, Q2. The bit line pairs SBL, SBL of the SRAM memory array 12 are connected to each I/O band I/O, I/O through the N-channel MOSFETs Q3, Q4. A joint transmission signal is applied per each block from the block decoder 13 to the gate of the MOSFETs Q1, Q2 of the transfer gate 110. Also, a column selection signal is applied with a corresponding column decoder 60 to each gate of the MOSFETs Q3, Q4 of each I/O switch 50.

When the transmission signal is applied to the transfer gate corresponding to each block by the block decoder 13 in this DRAM element, data on the same row is transmitted in block units from the DRAM memory array 1 to the SRAM memory cell array 12. When one of the word lines  $W_1 \sim W_n$  is selected from the SRAM memory cell array 12 by the way decoder 14, the data in each bit line part SBL, <u>SBL</u> that is stored in the SRAM memory cell 120 connected to the word lines is read. The data read on the bit line pairs SBL, <u>SBL</u> is read in the I/O band I/O, I/O by applying the column selection signal to the <u>I/O</u> switch 50 from the column decoder 60.

According to this DRAM element, because 1 data block has data in which 1 line corresponds to a plurality of columns, multiple data blocks on different rows are held in multiple SRAM memory cells 120, and the data blocks on different rows in the same column are held in the SRAM memory cell array 12 (associativity).

Accordingly, because this SRAM memory cell array is used as a cache memory, the number of data entries can thus be increased and the result is that the cash hit rate can be increased.

Furthermore, when the word lines  $W_1 \sim W_n$  of the SRAM memory cell array 12 are maintained in the non-active state, during writing operations applied to the DRAM memory cell array, but also during reading operation when reading is performed from the DRAM memory cell array 1, because a configuration can be created in which transmission to the cache memory is not carried out, the advantage is that the extent of the freedom available for the application of the cache system is increased.

Figure 11 is a block diagram showing the construction of a simple cache system using the DRAM element shown in Figure 9.

In Figure 11, the construction of a main memory 30 creates a 1 M byte configuration comprising 8 DRAM elements 31 in a 1 M x 1 construction. The difference between the memory system shown in Figure 11 and the memory system shown in Figure 7 is that the number of the word lines in the SRAM memory cell array 12 and the number of the block segments (set number) of the DRAM element 31 is correspondingly increased in TAG 25 and comparator 26, and the cache hit signal CH and the way address signal WA, which are output from the comparator 26, are input to the DRAM element 31. Here, the way signal has 2 bits.

The reference provided in Figure 6A ~ C and Figure 12 shows operation waveform diagrams used to explain the operation of the conventional simple cache system with the operation of the simple cache system shown in Figure 11.

TAG 25 holds row addresses corresponding to the rows selected in the most recent cycle for each block as an address set using multiple sets of caches. Because in this case, the way address signal can be considered as a 2-bit signal, 4 sets of row addresses are held. Accordingly,

16 address sets will be stored in the TAG 25. In addition, sets of addresses that are often used are held in a fixed manner in the TAG 25.

First, address signal corresponding to data which is requested by the CPU 24 is generated by the address generator 23. The comparator 26 compares the address set stored in the TAG 25 to the multiple bits (2 bits in the example indicated in Figure 9) corresponding to the block segments out of the row address signal RA and column address signal CA of 10 bits in the address signal. After that, if both items coincide, a cache hit is created and the comparator 26 will issue a high-level cache hit signal CH and a way address signal WA for the hit block. A state machine 27 toggles in response to this cache hit signal CH low address strobe signal RAS so that it is maintained on the low level with the column address strobe signal CAS. In response to that, an address multiplexer 22 applies 10-bit column address signal CA to the DRAM element 31 (see Figure 12). At this time, because control is exercised in the DRAM element 31 with the cache hit signal CH as shown in Figure 9, the column address signal CA will not be furnished to the block decoder 13.

### [page 6]

Accordingly, a separated state is maintained for the DRAM memory cell array 1 and for the SRAM memory cell array 12. Also, the data in each of the bit line pairs SBL, <u>SBL</u> is read according to the way address signal WA. Further, a conductive state is maintained with a column decoder 60 by an I/O switch 50 in response to the column address signal CA. Because of that, data present in the SRAM memory 120 is output in response to the column address signal CA and the way address signal WA through the I/O band I/O, <u>I/O</u> and the output buffer 9. In the case of such a hit, output data can be obtained at a high speed with the access time t<sub>CAC</sub> as if it were the page mode.

On the other hand, when the address signal generated from the address generate 23 does not coincide with the used address set which is held in the TAG 25, a cache miss is created, which is why the comparator 26 will not generate high-level cache hit signal CH.

In this case, the state machine 27 performs an ordinary read cycle of the RAS and CAS control signal, and the address multiplexer 22 sequentially supplies to the DRAM element 31 the row address signal RA and the column address signal CA (see Figure 12). Therefore, because in the case of such a cache miss, output data will be obtained with the low-speed access time trace, the state machine 27 will generate the wait signal Wait and the wait state is applied to the CPU 24. In the case of the cache miss, the block data contained in memory cells accessed at this time is transmitted when the block decoder 13 is in the conductive state through the transfer gate 110 from the bit line pairs BL, BL of the DRAM memory cell array 1 in one batch to the block of the SRMA memory 120 selected by the way address signal WA. The content stored in this block of the SRAM memory cell 120 can be rewritten in this manner. Also, a new address related to the way address signal WA of the corresponding block will be held in the TAG 25.

Therefore, because the data of a plurality of blocks is held in the SRAM memory cell 12 which is used as a cache memory in the simple cache system which uses the DRAM element shown in Figure 9, the cache hit rate is increased, which makes it possible to increase the number of entries for data sent to TAG 25.

Also, because the DRAM memory cell arrays is accessed here in the case of a cache miss, although transmission of data to the cache memory was performed from the SRAM memory cell array in the indicated example, this transmission can be also prohibited when a non-selective state is created for all the word lines of the SRAM memory cell array. At the same time, there is an option either to select or not to select the transmission to the SRAM memory array cell also when writing operations are applied to the DRAM memory cell array. Furthermore, the embodiment shown in Figure 11 corresponds to a 4-way set of an associative cache.

# (Problems to Be Solved By This Invention)

Nevertheless, when a cache hit was achieved according to the simple cache systems described above, the way address signal WA, which was selected from the address signal to access the SRAM memory cell array 12 as a cache memory, was output after a comparison was carried out with the comparator 26. Therefore, because the way address signal WA was supplied to the DRAM element 31, the operation of the word lines of the SRAM memory cell array 12 was delayed, and while the device can be used as a cache memory having a high-speed SRAM memory cell array 12, the disadvantage of the device is that high-speed access time operations cannot be conducted during a hit.

In order to solve the problems mentioned above, the purpose of this invention is to provide a semiconductor memory device having a built-in cache memory, which makes it possible to create the configuration of a cache system in which high-speed access time operations can be conducted during a hit.

#### (Means to Solve Problems)

The semiconductor device of this invention is equipped with a first memory cell array, a row selection means, a column selection means, a block selection signal input means, a block selection means, a second memory cell array, a region selection signal input means, a region selection means, a data transmission means, a first selection means, and a second selection means.

#### [page 7]

The first memory cell array comprises a plurality of memory cells arranged in multiple rows and columns, which are also divided into a plurality of blocks with a plurality of column units. The row selection means is used to select each row in multiple memory cells. The column selection means is used to select each column in multiple memory cells. The block selection

signal input means is used to input a block selection signal. The block selection means is used to select one out of the plurality of blocks in the first memory cell.

In addition, the second memory cell array, which comprises multiple static memory cells arranged in multiple rows and multiple columns, is divided into multiple regions and into multiple column units. The region selection means can be used to select any of the multiple regions of the second memory cell array in response to the region selection signal.

The data transmission means is used to transmit data between the blocks of the first memory cell array, selected with the block selection means, and the region of the second memory cell array, selected with the region selection means.

In addition, the first selection means selects any information corresponding to the plurality of static memory cells contained in each region of the second memory cell array. The second selection means is used to perform selection in response to the region selection signal to select any of the multiple information items selected in each region with the first selection means.

### (Operation)

In the semiconductor memory device provided with a built-in cache memory relating to this invention, data blocks can be held on the second memory cell array in multiple rows of the first memory cells, and data blocks can be held in different regions of the second memory cell array simultaneously with multiple sets of data blocks having different rows in the same column of the first memory cell array.

Also, the data blocks of different rows in the same column of the first memory cell array can be arranged in the same row of the second memory cell array. Therefore, by using the cache memory of this second memory cell array, the number of entries for data can be effectively increased, which not only makes it possible to increase the cache hit rate, but also enables high-speed access time operations of the cache memory.

#### (Embodiment)

The following as an explanation of one embodiment of this invention which uses the enclosed figures.

Figure 1 is a block diagram which shows the construction of a DRAM element according to one embodiment of this invention.

As this embodiment is the same as the DRAM element shown in Figure 9 with the exception of the points described below and the same reference symbols are applied to the corresponding parts, an explanation thereof will be omitted when appropriate.

As shown in the figure, a DRAM memory cell array 1 is divided into multiple blocks on

its address space. This embodiment is divided into 4 blocks BK 1 ~ BK4. Moreover, a SRAM memory cell array 12 is divided into multiple ways in multiple column units. However, it is also possible to use a different number of blocks in the DRAM memory cell array 1 and a different number of ways in the SRAM memory array 12.

Between the DRAM memory cell array 1 and the SRAM memory cell array 12 are arranged a sense amplifier part 4, a block transfer gate part 11, an internal I/O band 41, and a way transfer gate part 42. A block decoder 13, responding to one part of the column address signal CA, (2 bits in the case of this embodiment), instructs the block transfer gate part 11 whether and which block data of the DRAM memory cell array 1 is to be transmitted. The way transfer gate part 42 transmits data transmitted to the internal I/O band 41 to one of the ways of the SRAM memory arrays 12.

#### [page 8]

The way decoder 14 instructs the way transfer gate part 42 whether and to which way the data of the internal I/O band 41 is to be transmitted in response to the address signal applied through the way address buffer 15.

In the SRAM main memory array 12 is deployed a cache row decoder 43, a cache I/O switch part 44, and a cache column decoder 45. The cache row decoder 43 selects 1 row of the SRAM memory array 12 in response to the cache row address signal acquired from the cache address buffer 46. The cache column decoder part 45 selects 1 column in each of the ways in response to the cache column address applied from the cache address buffer 46. The cache address buffer 46 inputs the column address signal CA applied to the DRAM memory cell array 1 as the cache address signal CCA. A part thereof is applied as a cache row address to the cache row decoder 43, and the other part is applied as a cache column address signal to the cache column decoder 43. Multiple SRAM sense amplifiers 47, corresponding to each of the ways of the SRAM memory cell array 12, are connected to the cache I/O switch part 44 thought respective I/O lain pairs I/O<sub>A</sub> ~ I/O<sub>D</sub>.

The data contained in the SRAM memory cell array 12, selected for each way with the cache row decoder 43 and with the cache column decoder part 45, is detected and amplified by each corresponding SRAM sense amplifier 47. A way selector 48 selects one data item from the data applied via a plurality of SRAM sense amplifiers 47 in response to the way address signal WA applied from the way address buffer 15, and outputs through an output buffer 9b cache output data  $D_{\text{OUT}}$  to an external part. When data applied to the input buffer 10b as cache input data  $D_{\text{IN}}$  is written to 1 of the memory cells of the SRAM memory cell array 12, the opposite path to that described above is used.

Figure 1 shows the status when data A<sub>1</sub>, B<sub>1</sub>, C<sub>1</sub> and D<sub>1</sub> in each of the rows of the block BK1 of the DRAM memory cell array 1 is transmitted to the same row of each way A, B, C and of the SRAM memory cell array 12.

Figure 2 is a diagram showing a detailed construction of one part of the configuration shown in Figure 1.

In each of the blocks BK1 ~ BK4 of the DRAM memory cell array 1, the sense amplifier part 4 and the block transfer gate part 11, the sense amplifier part 4 and the block transfer part 11 comprise n sense amplifier parts 4 and n block transfer gates 110, which are provided with corresponding n bit lines BL<sub>1</sub> ~ BL<sub>n</sub>. Also, the internal I/O band 41 comprises n I/O lines I/O<sub>1</sub> ~ I/O<sub>n</sub>. The bit lines BL<sub>1</sub> ~ BL<sub>n</sub> in each block are connected to respective corresponding I/O line pairs I/O<sub>1</sub> ~ I/O<sub>n</sub> through the sense amplifier 40 and block transfer gate 110.

On the other hand, the SRAM memory cell array 12 is divided into 4 ways and each way comprises a SRAM memory cell 120 with n columns, that is to say n bit line pairs SBL<sub>1</sub> ~ SBL<sub>n</sub>. Each of the ways comprises a way transfer gate part 42, and way transfer gate 420 with corresponding n bit line pairs SBL<sub>1</sub> ~ SBL<sub>n</sub>. In each of the ways, respective n bit line pairs SBL<sub>1</sub> ~ SBL<sub>n</sub> are connected through the way transfer gate 420 to the corresponding I/O line pairs I/O<sub>1</sub> ~ I/O<sub>n</sub>. The cache I/O switch part 44 comprises cache I/O switches 440 corresponding to respective bit line pairs SBL<sub>1</sub> ~ SBL<sub>n</sub> of the SRAM memory cell array 12, and 4 respective corresponding I/O lines I/O<sub>A</sub> ~ I/O<sub>D</sub>. The n bit line pairs SBL<sub>1</sub> ~ SBL<sub>n</sub> belonging to each of the ways are connected respectively through the cache I/O switch 440 to the I/O line corresponding to the way. For example, the bit line pairs SBL, SBL<sub>n</sub> belonging to the way C, are all connected to the I/O line pair I/O<sub>C</sub>.

#### [page 9]

In addition, a cache column decoder part 45 is deployed for each of the ways. The cache column decoder part 45 of each of the ways comprises cache column decoders 450 corresponding to each column. Each of the cache column decoders 450 is connected to the MOS transistor gate of the corresponding cache I/O switch 440.

Figure 3 is a block diagram showing a simple cache system using the DRAM element of Figure 1.

As shown in Figure 3, the configuration of a main memory 30 comprises 1 M byte having 8 DRAM element 31 provided with the 1 M x 1 construction. Unlike in the memory system shown in Figure 11, in the memory system shown in Figure 3, 10-bit address signal corresponding to said column address signal multiplexed by the multiplexer 22 is input to the DRAM elements 31 as cache address signal, replacing the cache hit signal CH output from the comparator 26. Another difference is that the data selector signal, generated by the state machine 27, corresponding to the cache hit signal CH, is input to a data selector 51. The data selector 51 selects and outputs DRAM data DD, applied from the DRAM element 31 in response to the data selector signal DS, or cache data CD.

The operation of the simple cache system shown in Figure 3 will now be explained while referring to the operation of the waveform diagram shown in Figure 4.

TAG 25 holds address sets which are used by a plurality of caches for row addresses corresponding to the rows selected in the most recent cycle for each individual block. In this case, because the way address signal WA can be considered as a 2-bit signal, 4 sets of row address are held. Therefore, when 4 blocks are used, 16 address sets will be stored in TAG 25. In addition, addresses that are often used are held in a fixed manner in the TAG 25.

First, address signal corresponding to the data which is requested by the CPU 24 is generated by the address generator 23.

The comparator 26 compares the address set hold in the TAG 25 to multiple bits (2 bits in the example indicated in Figure 3) corresponding to a block segment out of the column address signal CA and the row address signal RA, with 10 bits out of the 20-bit address signal. After that, if there is a coincidence between both items, a cache hit is created, and the comparator 26 will generate the cache hit signal CH on the high level and the way address signal WA for the hit block.

Before the comparison of the address signal is carried out by this comparator 26, assuming that a cache hit occurs, 10-bit cache address signal CCA is input to the DRAM element 31 so that SRAM cell reading operation will proceed. Therefore, when a cache hit occurs and the way address signal WA is input, the desired data is output at a high speed through the cache output buffer 9b as cache data CD, and cache memory data is obtained from the data selector 51 with the data select signal DS, which is generated in response to the cache hit signal CH.

Conversely, when the address signal which has been input to the comparator 26 does not coincide with the address set held in the TAG 25, a cache miss is created, and the cache hit signal CH will not be generated by the comparator 26. Because of that, the cache data CD output from the SRAM memory cell will be ignored. In this case, the state machine 27 performs RAS and CAS signal control in the ordinary read cycle, and the address multiplexer 22 supplies to the DRAM element 31 sequentially the row address signal RA and the column address signal CA (see Figure 4). Therefore, because output data is obtained with the low-speed access time T<sub>RAC</sub> in the case of such a cache system, wait signal Wait is generated by the state machine 27 and the CPU 24 is brought into the standby state.

[page 10]

In the case of a cache miss, the block data contained in the memory cell accessed at that time is transferred to the I/O line pairs  $I/O_1 \sim I/O_n$  of the internal I/O band 41 through the block transfer gate 110 when a conductive state is created by the block data 13. Also, this data is transferred to a suitable SRAM memory cell array 12 through the way transfer gate which is selected by the way address signal WA, and the content stored in the SRAM memory cell 120 in the row

selected by the cache row decoder 43 is rewritten. In addition, a new address set accessed at this time is held in the TAG 25, which relates to the way corresponding to this data block.

As was explained above, the present embodiment makes it possible to increase the number of data entries to the TAG 25 because data corresponding to a plurality of blocks can be held in the SRAM memory cell array 120 as in cache memory. The result is that the probability of a hit is increased, while another effect is that the cache memory can be accessed with an access time at a high speed.

#### (Effect of the Invention)

As was explained above, since the present invention makes it possible to hold a great number of data blocks of the first memory cell array in the second memory cell array without increasing unnecessarily the block size, the number of data entries can thus be effectively increased

Moreover, because data blocks of different rows relating to one column of the first memory cell array is stored in the same row on the second memory cell array, any of the regions can be selected after the information has been read from each region of the second memory cell array. Therefore, since the second memory cell array can be used as a cache memory, access is enabled at an extremely high speed when there is a cache hit. Accordingly, when the semiconductor memory device of this invention is used, this makes it possible to create the configuration of a simple set-associative cache system enabling cache hit operations at a high speed.

#### 4. Brief Explanation of Figures

Figure one is a construction block diagram of a semiconductor memory device according to one embodiment of this invention, Figure 2 is a block diagram showing the details of the construction of one part of the semiconductor memory device shown in Figure 1, Figure 3 is a block diagram showing the construction of a simple set-associative cache system which utilizes the semiconductor memory device shown in Figure 1, Figure 4 is an operation waveform diagram explaining the operation of the simple cache system of Figure 3, Figure 5 is a block diagram showing the construction of a conventional DRAM element, Figure 6A is an operation waveform diagram of an ordinary read cycle of a DRAM element according to prior art, Figure 6B is an operation waveform diagram of the page mode cycle of a DRAM element according to prior art, Figure 6C is an operation waveform diagram of the static column mode of a DRAM element according to prior art, Figure 7 is a block diagram showing the construction of a simple cache system utilizing the DRAM element shown in Figure 5, Figure 8 is an operation waveform diagram of the simple cache system of Figure 7, Figure 9 is a block diagram showing the construction of a DRAM element provided with a built-in cache memory, Figure 10 is a block diagram showing the detailed construction of one part of the DRAM element of Figure 9, Figure 11 is a block diagram showing the construction of a simple cache system utilizing the DRAM element of Figure 9, and Figure 12 is an operation waveform diagram of the simple cache system of Figure 11.

In these figures, 1 is a DRAM memory cell array, 2 is a word driver, 3 is a row decoder part, 4 is a sense amplifier part, 5 is an I/O switch part, 6 is a column decoder part, 7 is a row address buffer, 8 is a column address buffer, 9a, 9b are output buffers, 10a, 10b are input buffers, 11 is a block transfer gate part, 12 is a SRAM memory cell array, 13 is a block decoder, 14 is a way decoder, 15 is a way address buffer, 41 is a built-in I/O belt, 42 is a way transfer gate part, 43 is a cache row decoder, 44 is a cache I/O switch part, 45 is a cache column decoder part, 46 is a cache address buffer, 47 is a sense amplifier for SRAM, 48 is a way selector, BL, BL is a pair of bit lines of a DRAM memory cell array, and SBL, SLB is a pair of bit lines of a SRAM memory cell array.

In addition, the same symbols indicate the same or corresponding parts in the figures.

### [page 11]

- 1 DRAM memory cell array
- 2 word driver
- 3 row decoder part
- 4 sense amplifier
- 5 I.O switch part
- 6 normal column decoder
- 7 row address buffer
- 8 column address buffer
- 9a output buffer
- 9b output buffer B cache Dout
- 10a input buffer
- 10b input buffer B cache DIN
- 11 block transfer gate part
- 12 SRAM memory cell array
- 13 block decoder
- 14 way decoder
- 15 way address buffer
- 41 built-in I/O belt
- 42 way transfer gate part
- 43 cache column decoder
- 44 cache I/O switch part
- 45 cache column decoder part
- 47 SRAM sense amplifier
- 48 way selector

# Figure 2

| (1) | way decoder output              |
|-----|---------------------------------|
| (2) | block decoder output            |
| (3) | the result of blocks BK3 and BK |
| (4) | DRAM memory cell array          |
| (5) | the result of way A and B       |
| 450 | cache column decoder            |
| 450 | cache column decoder            |
| 440 | cache I/O switch                |
| 120 | SRAM memory cell                |
| 120 | SRAM memory cell                |
| 120 | SRAM memory cell                |
| 420 | way transfer gate               |
| 110 | block transfer gate             |
| 45: | cache column decoder part       |
| 44: | cache I/O switch part           |
| 12: | SRAM memory cell array          |
| 42: | way transfer gate part          |
| 41. | built-in I/O belt               |

block transfer gate part DRAM memory cell array

# [page 12]

11: 1:

# Figure 3

address multiplexer
address generator
latch (TAG)
comparator
state machine
main memory (1 B byte)
data selector

# Figure 4

system block
 address (20)
 cache Dout
 high impedance

# Figure 5

- 1 memory cell array
- 2 word driver
- 3 row decoder part
- 4 sense amplifier
- 5 I/O switch part
- 6 column decoder part
- 7 row address buffer
- 8 column address buffer
- 9 output buffer Dout
- 10 input buffer D<sub>IN</sub>

### Figure 6A

- (1) ordinary cycle
- (2) valid
- (3) page mode cycle

### Figure 6B

- (3) page mode cycle
- (4) valid
- (5) valid

# Figure 6C

- (6) static column mode
- (7) valid
- (8) valid

# [page 13]

# Figure 7

- 20: main memory (1 M byte)
- 22: address multiplexer
- 23: address generator
- 25: latch (TAG)
- 26: comparator
- 27: state machine

- (1) system clock
- (2) address (20)

### Figure 9

- 1 DRAM memory arrays B1 ~ B4
- 2 word driver
- 3 row decoder part
- 4 sense amplifier part
- 5 I/O switch part
- 5 block decoder
- 6 column decoder part
- 7 row address buffer
- 8 column address buffer
- 9 output buffer Dout
- 10 input buffer D<sub>IN</sub>
- 11 transfer gate part
- 12 SRAM memory cell array
- 13 block decoder
- 14 way decoder
- 15 way address buffer

- (A) block boundary
- 1 DRAM memory array
- 12: SRAM memory cell array
- 13 block decoder
- 50 I/O switch
- 60 column decoder
- 60 column decoder
- 110 transfer gate
- 120 SRAM memory cell

# [page 14]

# Figure 11

- address multiplexer address generator latch (TAG) comparator 22 23 25 26

- 27 30
- state system
  main memory (1 M byte)

- system clock address (20) (1) (2)











**-- 649 --**





第12図